FILTER MODE ACTIVE

#долгий контекст

Найдено записей: 2

#долгий контекст06.09.2025

Alibaba представила Qwen3-Max-Preview — модель с триллионом параметров и контекстом в 262K токенов

'Qwen3-Max-Preview — первая триллионная модель Alibaba с окном контекста в 262K токенов и конкурентной производительностью; доступна только через API и по ступенчатой оплате.'

#долгий контекст13.08.2025

Reinforcement Learning открывает потенциал открытых LLM для долгих задач в разработке ПО

Исследование Nebius AI и Humanoid применяет модифицированный DAPO для обучения открытой модели Qwen2.5 на многотуровых задачах разработки ПО, добившись 39% Pass@1 на SWE-bench Verified без учителя.